倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站

倉頡論壇

【坊间】自用·仓颉六代编码勘误
馬拉一個錘子 發表於 25-11-2025 06:06 PM
在討論之前,不妨先釐清概念。
倉頡輸入法的「複合字首」是不可隨意類推的。例如在五代,「厭」是複合字首 ...

2025-11-26_081554.png


2025-11-26_080553.png
本帖最後由 馬拉一個錘子 於 26-11-2025 08:45 AM 編輯

並非看起來像就是複合字首,該字應取碼「一日大土」。
在第五代手冊中,專門提過,「例外字的種類,皆已舉全,若憑主觀自定例外字,將取不到正確字碼」。
再舉一例,「」在五代是複合字首,所以「」可取碼「戈木手」,而「𠩵」看起來很像「」,在第五代中卻並非複合字首,所以五代「歴」取碼「一木木一」而非「一木一」。

  • 截屏2025-11-26 08.35.41.png
馬拉一個錘子 發表於 26-11-2025 08:37 AM
並非看起來像就是複合字首,該字應取碼「一日大土」。
在第五代手冊中,專門提過,「例外字的種類,皆已舉 ...

它們是結構相同的字
這樣是不是違背了「使用上的方便簡易」的初衷

2025-11-26_084417.png


山水晏 發表於 26-11-2025 08:48 AM
它們是結構相同的字
這樣是不是違背了「使用上的方便簡易」的初衷

規則就是規則,是為了方便去定了規則,而不是為了方便連規則都要打破。
馬拉一個錘子 發表於 26-11-2025 08:52 AM
規則就是規則,是為了方便去定了規則,而不是為了方便連規則都要打破。 ...

違背初衷的規則就打破

才不會造成「坊間倉頡碼」的「粗製濫造」
馬拉一個錘子 發表於 26-11-2025 08:52 AM
規則就是規則,是為了方便去定了規則,而不是為了方便連規則都要打破。 ...

「是為了方便去定了規則,而不是為了方便連規則都要打破」

這句話是不是有點矛盾
本帖最後由 馬拉一個錘子 於 26-11-2025 09:53 AM 編輯
山水晏 發表於 26-11-2025 09:21 AM
「是為了方便去定了規則,而不是為了方便連規則都要打破」

這句話是不是有點矛盾

目前,無論是實際編碼,還是手冊規則,都不支持複合字首可隨意類推這個說法。
如「今」看起來有些像「合」,但「合」在五代手冊是複合字首,「今」不是,「貪」是「人戈弓金」。
再如,「孽」的「薛」是複合字首,所以在五代取「廿十弓木」,而「蘗」的「薜」不是複合字首,所以在五代取「廿尸十木」。

而且,像與否是一種主觀判斷,有些人可能認為像,一些人可能認為否。例如台灣習慣將「今」的中間寫成橫,可能會覺得「今」和「合」有些相似,可中國內地把「今」的中間寫成「點」,也許就不認為兩者相似。以誰的「像」為標準呢?

如果只要有人認為「像」就可以類推的話,反而會引起更大的不便,要麼是造成許多重碼,和倉頡的設計初衷相違背,要麼是用戶得去猜哪些像哪些不像,這還有方便可言嗎?
如果希望「像就可以當字首」的話,可以在列明有什麼修改的情況下自己開分支,倉頡沒有專利,允許大家做這樣的事。
本帖最後由 蓼汀花溆 於 26-11-2025 03:08 PM 編輯

希望我這個和事佬的出現不會火上澆油,大家冷靜一點。

首先,我們可以看看以上的倉五的手冊,以下是它的網頁,我們可以翻到複合字的部分。
https://www.chinesecj.com/5cjbook/

上面明確說明哪些是複合字,哪些不是複合字。
至於山水晏同學提出對漢字的理解,很遺憾的是,如果修改了倉頡的規則,其他倉頡使用者就會覺得無所適從,不知道哪個規則、哪個碼表是對的。
其實還有一個解決方法,就如馬拉兄所說的,倉頡本身是開源的,各自開啟一個倉頡的分支,取另一個名字,造另一個規則、另一套字根圖、另一個碼表,就不會出現以上的爭議。


至於為什麼要在官方倉頡的規則上提出不同的意見,要求官方也認同自己的觀點呢?我其實也感同身受。我不能夠瞭解別人的想法,但我可以反思我自己的理由是什麼。
首先要從漢字的特性說起,漢族的歷史其實是從晚清開始的,客家人、廣東人、福建人、上海人、滿人、蒙古人為了團結抵抗列強的侵略,提出團結的口號,稱為“漢族”,認為漢族要團結一致,才可以抵抗外國人的侵略。漢族的漢語是在1932年形成的,包括發音和文字,簡化字在1954年形成。漢字在漢族形成以前就有了,為了適應漢族的漢語,漢字本身也做出了一些調整。所以就以上的話題而言,其實也包括了對漢字的理解,例如死字是怎樣的結構?

目前臺灣的國語、大陸的普通話都圍繞漢字展開,一般學習漢字的人只要認識常用字當中的4000-6000字就能熟悉普通話、國語所需要的漢字。6000字以外的字,一般人也很難認識當中隨機抽取出的試題中的30%。(此外還有香港人用的字,暫時不討論。)

倉頡的設計,對於6000字以內,想要設計出合理的規則,需要很多的努力,但只要時間、人力、資源足夠,應該能做到盡善盡美。目前倉頡的碼表也能達到幾萬字的規模,都是根據倉頡取碼的規則而來,我不能說這套規則最好,但規則就是要遵守。

如果你是會對文字的理解超出一般人所認識的範圍,當你看到一般人所用的字到6000字幾乎是極限了,你就會認為你知道的比別人多。即使你對這幾萬字有更深的理解,認為這是對漢字的正確理解,但這也不是我們能就此修改官方倉頡規則的理由。你認為你所認識的漢字,面對足夠的證據面前,你有理由相信你是對的,因此你也嘗試說服別人也來吸收這公用領域的知識,這會形成一個陷阱,認為別人對這公用領域有偏差,所以你要去糾正它。但我們知道語言是活的,不一定是有理由就是對的,還要看有沒有共識。

我在自己設計自己的嗆輸入法時,難免會魔怔了一下,我相信許多看過超過6000字的人可能也會魔怔,這幾萬字有致命的吸引力,會讓人掉進這個漩渦裡面。
希望大家冷靜一點哈,官方規則可以認識、討論,但不能以自己的意見去改動它。
馬拉一個錘子 發表於 26-11-2025 09:28 AM
目前,無論是實際編碼,還是手冊規則,都不支持複合字首可隨意類推這個說法。
如「今」看起來有些像「合」 ...

【「孽」的「薛」是複合字首,所以在五代取「廿十弓木」,而「蘗」的「薜」不是複合字首,所以在五代取「廿尸十木」。】

類似這種相同結構用不同取碼規則的情況
最容易造成分歧


山水晏 發表於 26-11-2025 11:21 AM
【「孽」的「薛」是複合字首,所以在五代取「廿十弓木」,而「蘗」的「薜」不是複合字首,所以在五代取「 ...

所以我說語言是活的,有理由、有證據也不一定是最正確的,還需要有共識。
上一頁第4頁下一頁
回復 1收藏 淘帖